Modelado de Recompensa para Orquestación Multi-Agente
Descubre OrchRM, un marco auto-supervisado que mejora hasta 10x la eficiencia de tokens y un 8% la precisión en orquestación multi-agente sin anotaciones humanas.
Descubre OrchRM, un marco auto-supervisado que mejora hasta 10x la eficiencia de tokens y un 8% la precisión en orquestación multi-agente sin anotaciones humanas.